خوشه بندی سبک نگارش دست نوشته برون خط فارسی

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
  • author فاطمه ولایتی
  • adviser احسان اله کبیر
  • Number of pages: First 15 pages
  • publication year 1390
abstract

هدف این پایان نامه، یافتن و استخراج ویژگی هایی است که بر مبنای آن بتوان دست خط فارسی را خوشه بندی کرد. در این کار، در ابتدا بر روی ویژگی های مبتنی بر بافت، تمرکز شده است. این ویژگی ها شامل دو دسته ویژگی آماری ماتریس باهم آیی و ویژگی مبتنی بر تبدیل گابور است. برای استخراج این ویژگی ها، یک بافت مناسب در ابعاد 1024×1024 مستقل از محتوای سند، از تصویر دستنوشته ایجاد می شود. از ویژگی های دیگری که در این کار از آن ها استفاده شده است، تعدادی ویژگی ساختاری مبتنی بر منحنی پیرامونی است. این ویژگی ها را از هر یک از تصاویر موجود در یک مجموعه داده از 97 دستنوشته فارسی که دارای متون متفاوتی بودند، استخراج کردیم و از الگوریتم k میانگین و شبکه عصبی نگاشت ویژگی خود سامان، برای خوشه بندی این ویژگی ها استفاده شده است. برای ارزیابی این ویژگی ها، یک روش ارزیابی بر مبنای الگوریتم خوشه بندی k میانگین، طراحی کرده ایم. در این الگوریتم از معیار مقایسه باینری ژاکارد استفاده کرده ایم، هم چنین برای محاسبه مراکز خوشه در هر دوره تکرار از الگوریتم k میانگین، از روش انتخاب داده چرخ رولت، بهره گرفته ایم. نتایج بدست آمده، نشان می دهد با ترکیب دو نوع از ویژگی های مبتنی بر منحنی پیرامونی، نرخ خوشه بندی، 75درصد است که نسبت به سایر روش های مورد استفاده در این کار، نرخ بهتری را در برداشته است. کلید واژه: سبک نگارش، خوشه بندی، بافت، فیلتر گابور، ماتریس با هم آیی، منحنی پیرامونی، ژاکارد، چرخ رولت ?

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

تشخیص برون خط کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی

تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستم های برون خط خود به دو دسته تقسیم می شود: سیستم های مبتنی بر جداسازی و سیستم های کلی نگر. در سیستم های مبتنی بر جداسازی سعی می ش...

بازشناسی برون خط کلمات دست نوشته فارسی در یک مجموعه ای از لغات

در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای...

15 صفحه اول

بازشناسی بر خط و بدون محدودیت دست نوشته فارسی

بازشناسی برخط نوشتار یکی از دشوارترین زمینه های شناسایی الگو و هوش مصنوعی بوده و همواره مورد توجه خاص محققان قرار گرفته است. پیچیدگی این زمینه, هنگام برخورد با زبان هایی مثل فارسی و عربی که حروف آن ها باتوجه به موقعیت شان در کلمه, شکل های متفاوتی به خود می گیرند, دوچندان می شود. تحلیل دست نوشته ی فارسی یا عربی در مقایسه با زبان های لاتین، به علت حضور اجزای کوچکی ("نقطه", "دونقطه" و ...) بالا یا...

15 صفحه اول

دست نوشته های اسماعیلیان بدخشان

در دور دست‌ها ، پهلو به پهلوی چین ، باریکه سرزمینی است ،‌‌ بسیار مرتفع ، با کوه‌های آسمان بوس و به هم فشرده‌ ، با معبرهای تنگ دشوار گذر، با زمستان‌های سرد نه ‌ماهه‌ ، برخوردگاه چهار تمدن بزرگ آسیا‌: ایران‌، هند‌، چین و آسیای مرکزی که دورترین نقطه است نسبت به همه‌ی آنها و پناهگاهی است امن برای رانده‌شدگان از سراسر این سرزمین‌ها ،نه تنها کسان که حتی باورها و اندیشه‌های کهن ، نه در کنار‌هم که آمیخ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023